Nanodegree key: nd002-cn-advanced
Version: 6.0.0
Locale: zh-cn
有效期内,如果你已经通过所有实战项目,请及时完成毕业;如未及时毕业,有效期结束后课程将被锁定,无法继续回看。
- 本课程提供实战项目代码审阅和中文论坛答疑,如有学习疑问,请及时查阅论坛或发帖咨询。
- 通过所有必修项目后,在课程中你将看到“完成毕业流程”的按钮,按照流程完成即可获得自己的毕业证书。
Content
Part 02 : 新生训练营
快速了解课程内容与服务设置,熟悉学习系统的操作方法,为展开学习做准备。好的开始是成功的一半,赶紧开始吧!
-
Module 01:
新生训练营
-
Module 02:
课程说明
Part 03 (Elective) : 用 Python 进行简单数据分析
复习和巩固如何使用 Python 进行数据分析的基本流程。
-
Module 01:
数据分析过程
-
Lesson 01: 数据分析过程
- Concept 01: 课程概述
- Concept 02: 数据分析师解决的问题
- Concept 03: 设置编程环境
- Concept 04: 数据分析过程概述
- Concept 05: 练习:数据分析过程
- Concept 06: 包概述
- Concept 07: 包概述练习
- Concept 08: 提问
- Concept 09: 数据集问题
- Concept 10: 数据整理和 EDA(探索性数据分析)
- Concept 11: 收集数据
- Concept 12: 阅读 CSV 文件
- Concept 13: 评估和理解
- Concept 14: 评估和理解练习
- Concept 15: 清理数据
- Concept 16: 清理示例
- Concept 17: 清理练习
- Concept 18: 用可视化探索数据
- Concept 19: 使用 Pandas 绘图
- Concept 20: 练习: 用可视化探索数据
- Concept 21: 得出结论
- Concept 22: 得出结论示例
- Concept 23: 练习:得出结论
- Concept 24: 传达结果
- Concept 25: 传达结果示例
- Concept 26: 练习:传达结果
- Concept 27: 总结
-
-
Module 02:
冰与火之歌:五王之战
-
Lesson 01: 冰与火之歌:五王之战
使用《权力的游戏》中的战争数据,分析影响战争结果的因素,温习从提问到可视化的分析流程,并找到隐藏在数据中的战役制胜法宝!
-
Part 05 : 使用统计学验证应用中的假设
复习巩固概率论、贝叶斯定理、描述统计学、假设检验基础,以及运用 Python 编写函数和调用 Python 库的能力。
-
Module 01:
检验心理学现象
-
Lesson 01: 假设检验
- Concept 01: 可能或不可能
- Concept 02: α 水平
- Concept 03: Z 临界值 0.05
- Concept 04: Z 临界值 0.01
- Concept 05: Z 临界值 0.001
- Concept 06: 临界区域
- Concept 07: 显著性
- Concept 08: Darts 设计
- Concept 09: Z 值
- Concept 10: 双尾临界值 0.05
- Concept 11: 双尾检验
- Concept 12: 双尾概率
- Concept 13: 双尾临界值 0.01
- Concept 14: 双尾临界值 0.001
- Concept 15: 假设
- Concept 16: 拒绝零假设失败
- Concept 17: 拒绝零假设证据
- Concept 18: 均值和标准偏差
- Concept 19: 零假设
- Concept 20: 对立假设
- Concept 21: 单尾或双尾
- Concept 22: 进行假设检验
- Concept 23: 临界值 0.05
- Concept 24: 样本均值的 Z 值
- Concept 25: 假设检验的结果
- Concept 26: 增加样本量
- Concept 27: 拒绝或拒绝失败
- Concept 28: 获得均值的概率
- Concept 29: 决策失误
- Concept 30: 热饮料
- Concept 31: 下雨
- Concept 32: 发生了什么?
- Concept 33: 发生了什么?
- Concept 34: 容易产生误解
- Concept 35: 结束这节课...
- Concept 36: 假设检验
- Concept 37: 增加参与度?
- Concept 38: 小样本假设检验 - t 检验
- Concept 39: 小样本假设检验 - 自助法
-
Part 06 : 数据清洗
深入掌握如何从本地文件、API、互联网等不同来源收集数据,并进行有效清洗;使用 Pandas 评估数据,最后使用 Python 清洗和校验。
-
Module 01:
数据整理简介
-
Lesson 01: 数据整理简介
通过简单的练习来了解数据整理过程(收集、评估、清洗)的每个步骤。这节课的数据集是 Kaggle 的一个在线招聘信息数据集。
- Concept 01: 介绍
- Concept 02: 课程大纲
- Concept 03: 定义和类比
- Concept 04: 示例
- Concept 05: 练习和数据集
- Concept 06: 收集(简介)
- Concept 07: 模板和软件
- Concept 08: 练习:收集(下载)
- Concept 09: 练习:收集(打开 Jupyter Notebook)
- Concept 10: 练习:收集(解压压缩文件)
- Concept 11: 收集(CSV 文件)
- Concept 12: 练习:收集(导入)
- Concept 13: 收集(总结)
- Concept 14: 评估(简介)
- Concept 15: 练习:评估(可视)
- Concept 16: 练习:评估(编程)
- Concept 17: 练习:评估(整洁度)
- Concept 18: 评估(总结)
- Concept 19: 清洗(简介)
- Concept 20: 清洗(定义)
- Concept 21: 练习:清洗(代码 1)
- Concept 22: 练习: 清洗(代码 2)
- Concept 23: 练习:清洗(练习)
- Concept 24: 清洗(总结)
- Concept 25: 重新评估和迭代
- Concept 26: 整理与 EDA 与 ETL
- Concept 27: 分析与可视化
- Concept 28: 数据整理总结
- Concept 29: 还有一个问题
- Concept 30: 总结
-
-
Module 02:
收集数据
-
Lesson 01: 收集数据
利用 Python 收集各种来源和各种文件格式的数据。 本课的数据集,包含烂番茄评分(Rotten Tomatoes),罗杰·艾伯特评论 (Roger Ebert reviews) 和维基百科电影海报图片。
- Concept 01: 简介
- Concept 02: 课程大纲
- Concept 03: 数据集:寻找最好的电影
- Concept 04: 浏览工作目录和文件 I/O
- Concept 05: 资料来源:手头文件
- Concept 06: 平面文件结构
- Concept 07: Python 中的平面文件
- Concept 08: 资料来源:Web 数据抓取
- Concept 09: HTML 文件结构
- Concept 10: Python 中的 HTML 文件
- Concept 11: Flashforward 1
- Concept 12: 资料来源:从互联网下载文件
- Concept 13: 文本文件结构
- Concept 14: Python 中的文本文件
- Concept 15: 资料来源:API(应用程序编程接口)
- Concept 16: JSON 文件结构
- Concept 17: Python 中的 JSON 文件
- Concept 18: 混搭:API、以编程方式下载文件、JSON
- Concept 19: Flashforward 2
- Concept 20: 存储数据
- Concept 21: 关系数据库结构
- Concept 22: Python 中的关系数据库
- Concept 23: 其他文件格式
- Concept 24: 你可以迭代
- Concept 25: 收集:总结
- Concept 26: 总结
-
-
Module 03:
评估数据
-
Lesson 01: 评估数据
使用 pandas 从可视的角度以编程的方式评估数据的质量和整洁度。在这节课中,我们将使用的数据集是一种称为 Auralin 的新型口服胰岛素 II 期临床试验数据。
- Concept 01: 简介
- Concept 02: 课程大纲
- Concept 03: 数据集:口服胰岛素 II 期临床试验数据
- Concept 04: 未清理的数据:脏数据与杂乱数据 1
- Concept 05: 未清理的数据:脏数据与杂乱数据 2
- Concept 06: 评估:类型与步骤
- Concept 07: 目测评估
- Concept 08: 目测评估:认识自己
- Concept 09: 质量:目测评估 1
- Concept 10: 评估与探索
- Concept 11: 质量:目测评估 2
- Concept 12: 数据质量维度 1
- Concept 13: 数据质量维度 2
- Concept 14: 编程评估
- Concept 15: 质量:编程评估 1
- Concept 16: 质量:编程评估 2
- Concept 17: 整洁度:目测评估
- Concept 18: 整洁度:编程评估
- Concept 19: 预告
- Concept 20: 数据如何成为脏数据和杂乱数据
- Concept 21: 你可以迭代!
- Concept 22: 评估总结
- Concept 23: 总结
-
-
Module 04:
清理数据
-
Lesson 01: 清理数据
在该课中你会使用 Pandas,清除在“评估数据”课程中发现的数据质量和整洁度问题。 数据集是:模拟口服胰岛素 II 期临床试验数据。
- Concept 01: 简介
- Concept 02: 课程大纲
- Concept 03: 数据集:口服胰岛素 II 期临床试验数据
- Concept 04: 人工 Vs 程序清理
- Concept 05: 数据清理流程
- Concept 06: 清理步骤
- Concept 07: Notebook 解决方案说明
- Concept 08: 先处理数据缺失问题
- Concept 09: 练习:数据缺失
- Concept 10: 解决方案:数据缺失
- Concept 11: 清理之整洁度
- Concept 12: 练习:整洁度
- Concept 13: 解决方案:整洁度
- Concept 14: 清理之质量问题
- Concept 15: 练习:质量
- Concept 16: 解决方案:质量
- Concept 17: Flashforward
- Concept 18: 你可以迭代
- Concept 19: 清理总结
- Concept 20: 总结
-
-
Module 05:
实战项目
-
Lesson 01: 清洗与分析数据
收集各种来源和形式的数据,评估质量和清洁度,然后进行清洗。通过分析和可视化展示清洗过程。
-
Part 07 : 探索性数据分析
了解什么是探索性数据分析,并从配置环境开始,逐步掌握用 R 实现探索性数据分析和可视化。最后你将与 Facebook 数据科学家 Solomon Messing 一起进行钻石价格分析实战,巩固学到的内容。
-
Module 01:
用 R 进行数据分析
-
Lesson 02: R 基础
安装 RStudio 和拓展包,学习 R 的基本命令,练习编写简单 R 脚本,以及开始检查数据集。
- Concept 01: 用于数据可视化的 R
- Concept 02: R 的力量
- Concept 03: 为什么使用 R
- Concept 04: 使用 Windows 系统?
- Concept 05: 在 Windows 上安装 RStudio
- Concept 06: 在 Mac 上安装 RStudio
- Concept 07: 准备好探索数据了吗?
- Concept 08: RStudio 布局
- Concept 09: 揭秘 R
- Concept 10: 获得帮助
- Concept 11: 阅读并将数据子集化
- Concept 12: R Markdown 文档
- Concept 13: 因子变量
- Concept 14: 有序因子
- Concept 15: 设置有序因子的水平
- Concept 16: 数据加工
- Concept 17: 给数据科学家的建议
- Concept 18: 恭喜
-
Lesson 03: 探索单一变量
学习如何使用直方图、箱线图和转换去量化和可视化一个数据集中的单一变量。
- Concept 01: 欢迎!
- Concept 02: 首先该做什么?
- Concept 03: 伪 Facebook 用户数据
- Concept 04: 用户生日直方图
- Concept 05: Moira 的调查
- Concept 06: 评估你的受众规模
- Concept 07: 设想的受众规模
- Concept 08: 分面
- Concept 09: 保持怀疑态度 异常值和异态
- Concept 10: Moira 的异常值
- Concept 11: 好友数量
- Concept 12: 限制轴
- Concept 13: 利用组宽进行探索
- Concept 14: 调整组宽
- Concept 15: 忽略 NA 观测值
- Concept 16: 按性别“划分”的统计学
- Concept 17: 使用时长
- Concept 18: 标记图形
- Concept 19: 用户年龄
- Concept 20: 模因的传播
- Concept 21: Lada 的钱袋模因
- Concept 22: 转换数据
- Concept 23: 添加定标层
- Concept 24: 频率多边形
- Concept 25: 网页端上的“点赞”数
- Concept 26: 箱线图
- Concept 27: 好友分析中的箱线图、四分位数
- Concept 28: 符合逻辑
- Concept 29: 分析单一变量
-
Lesson 04: 习题集:探索单一变量
使用你在上一节课中学到的技巧,练习探索数据集中的单一变量。
- Concept 01: 这节课有些不同
- Concept 02: 钻石
- Concept 03: 价格直方图
- Concept 04: 价格直方图小结
- Concept 05: 钻石数量
- Concept 06: 廉价钻石
- Concept 07: 切工-价格直方图
- Concept 08: 切工-价格
- Concept 09: 标尺和多直方图
- Concept 10: 由切工决定的每克拉价格
- Concept 11: 价格箱线图
- Concept 12: 四分位数间距 — IQR
- Concept 13: 由颜色表示的每克拉价格箱线图
- Concept 14: 克拉频率多边形
- Concept 15: 用 R 进行数据整理
- Concept 16: Gapminder 数据
- Concept 17: 探索你的好友的生日
-
Lesson 05: 探索两个变量
学习散点图,线条图和相关性等技术,探索数据集中两个变量之间的关系。
- Concept 01: 欢迎!
- Concept 02: 散点图和设想的受众规模
- Concept 03: 散点图
- Concept 04: ggplot 语法
- Concept 05: 过度绘制
- Concept 06: coord_trans()
- Concept 07: Alpha 和 Jitter
- Concept 08: 过度绘制和领域知识
- Concept 09: 条件均值
- Concept 10: 将摘要与原始数据叠加
- Concept 11: Moira:直方图摘要与散点图
- Concept 12: 相关性
- Concept 13: 子集相关性
- Concept 14: 相关分析法
- Concept 15: 创建散点图
- Concept 16: 强相关
- Concept 17: Moira 对于相关的研究
- Concept 18: 相关系数的更多注意事项
- Concept 19: 噪声散点图
- Concept 20: 理解数据
- Concept 21: 一个新的视角
- Concept 22: 了解噪声:年龄到月龄
- Concept 23: 带有月均值的年龄
- Concept 24: 条件均值中的噪声
- Concept 25: 平滑化条件均值
- Concept 26: 该选哪个图形?
- Concept 27: 分析两个变量
-
Lesson 06: 习题集:探索两个变量
使用从上一课中学到的技巧,练习探索两个变量之间的关系。
- Concept 01: 价格与 x
- Concept 02: 发现 - 价格与 x
- Concept 03: 相关性
- Concept 04: 价格与深度
- Concept 05: 调整 - 价格与深度
- Concept 06: 典型深度范围
- Concept 07: 相关性 - 价格与深度
- Concept 08: 价格与克拉
- Concept 09: 价格与体积
- Concept 10: 发现 - 价格与体积
- Concept 11: 子集相关性
- Concept 12: 调整 - 价格与体积
- Concept 13: 平均价格 - 净度
- Concept 14: 平均价格柱状图
- Concept 15: 平均价格的趋势
- Concept 16: 重访 Gapminder
-
Lesson 07: 探索多个变量
L学习探索多个变量之间的关系的方法,了解如何重塑你的数据。
- Concept 01: 多变量数据
- Concept 02: 设想的受众规模 - 年龄
- Concept 03: 第三个定性变量
- Concept 04: 绘制条件小结
- Concept 05: 用比率思考
- Concept 06: 宽和长格式
- Concept 07: 重塑数据
- Concept 08: 比率图
- Concept 09: 第三个定量变量
- Concept 10: 切割一个变量
- Concept 11: 绘制在一起
- Concept 12: 绘制总均值
- Concept 13: 好友率
- Concept 14: 申请好友数
- Concept 15: 偏差方差折衷
- Concept 16: Sean 的 NFL 球迷情绪研究
- Concept 17: 酸奶数据集简介
- Concept 18: 重访直方图
- Concept 19: 购买数量
- Concept 20: 随时间变化的价格
- Concept 21: 采样观测值
- Concept 22: 查看家庭样本
- Concept 23: 截面数据的限制
- Concept 24: 多个变量
- Concept 25: 散点图矩阵
- Concept 26: 更多变量
- Concept 27: 热图
- Concept 28: 分析三个或更多变量
-
Lesson 08: 习题集:探索多个变量
使用在上一课中学到的技巧,练习探索多个变量之间的关系。
- Concept 01: 带有分面和颜色的价格直方图
- Concept 02: 价格与按切工填色的表格
- Concept 03: 典型表值
- Concept 04: 价格与体积和钻石净度
- Concept 05: 新建友谊的比例
- Concept 06: prop_initiated 与使用时长
- Concept 07: 平滑化 prop_initiated 与使用时长
- Concept 08: 最大的 prop_initiated 组
- Concept 09: 最大的组均值 prop_initiated
- Concept 10: 经过分组、分面和填色的价格/克拉
- Concept 11: Gapminder 多变量分析
-
Lesson 09: 钻石与价格预测
与 Facebook 数据科学家 Solomon Messing 一起探索钻石数据集。
- Concept 01: 欢迎!
- Concept 02: 线性回归模型
- Concept 03: 散点图回顾
- Concept 04: 价格与克拉的关系
- Concept 05: Frances Gerety
- Concept 06: 钻石的崛起
- Concept 07: ggpairs 函数
- Concept 08: 对钻石的需求
- Concept 09: 将需求与价格分布联系起来
- Concept 10: 散点图转换
- Concept 11: 复习过度绘制
- Concept 12: 定性因子的绘制颜色
- Concept 13: 价格与克拉和净度
- Concept 14: 净度与价格
- Concept 15: 价格与克拉和切工
- Concept 16: 切工与价格
- Concept 17: 价格与克拉和颜色
- Concept 18: 颜色与价格
- Concept 19: R 中的线性模型
- Concept 20: 构建线性模型
- Concept 21: 模型问题
- Concept 22: 更大、更好的数据集
- Concept 23: 预测
- Concept 24: 最终想法
- Concept 25: 恭喜和下一步
-
Module 02:
实战项目
-
Lesson 01: 实战项目
从优达学城提供的数据集中选择一个,或自己寻找一个数据集,对其进行完整的探索性数据分析。
-
Part 08 : 通过数据讲故事
深入了解数据可视化的重要性,包括不同的数据类型编码方式:色彩、形状、大小等;熟练掌握 Tableau 基本功能,并学习创建仪表盘和故事,实现生动有力的数据可视化。
-
Module 01:
课程说明
-
Module 02:
数据可视化
-
Lesson 03: 用Tableau创建可视化
- Concept 01: 什么是 Tableau?
- Concept 02: 安装 Tableau
- Concept 03: 连接数据
- Concept 04: 合并数据
- Concept 05: 工作表界面
- Concept 06: 汇总和粒度
- Concept 07: Show Me 功能
- Concept 08: 层级
- Concept 09: 标记选项
- Concept 10: 标记练习
- Concept 11: 小多组图
- Concept 12: 双坐标轴
- Concept 13: 过滤器
- Concept 14: 散点图和小多组图结合
- Concept 15: 组和集合
- Concept 16: 为世界杯数据绘制可视化地图
- Concept 17: 计算字段
- Concept 18: 表格计算
- Concept 19: 更多Tableau数据
- Concept 20: 可视化练习:最热技能
- Concept 21: 可视化练习:最热技能箱线图
- Concept 22: 可视化练习:最热技能分布图
- Concept 23: 小结
-
Lesson 04: 通过 Tableau 讲故事
在本课程中,你将向Tableau专家学习,并开始整理你自己的仪表板和故事。
-
Lesson 05: 创建一个 Tableau 故事
使用数据集创建 Tableau 数据可视化,以讲述有关数据的故事或突出显示数据的趋势或模式。你的工作是反映数据可视化的理论和实践。
Part 10 (Elective) : (可选)Anaconda 和 Jupyter Notebook
-
Module 01:
Anaconda 和 Jupyter Notebook
-
Lesson 01: 配置 Anaconda
如果你需要在本地配置编程环境并遇到问题,可以再针对性学习如何使用 Anaconda 管理包和开发环境。
-
Lesson 02: 配置 Jupyter notebook
你可以针对性学习如何使用 Jupyter notebook 来创建包含代码、文本和图像的叙述性文档。
-
Part 11 (Elective) : (可选)机器学习入门
-
Module 01:
机器学习基础 1
-
Lesson 01: 欢迎学习机器学习
认识 Sebastian 和 Katie,和他们一起讨论机器学习。
-
Lesson 02: 朴素贝叶斯
学习分类、训练和测试,并使用 Scikit 学习运行一个朴素贝叶斯分类器。
- Concept 01: Google 无人驾驶汽车中的机器学习
- Concept 02: acerous 还是 non-acerous?
- Concept 03: 监督分类示例
- Concept 04: 特征和标签音乐示例
- Concept 05: 特征可视化
- Concept 06: 肉眼分类
- Concept 07: Stanley 地形分类简介
- Concept 08: 散点图:坡度和颠簸度
- Concept 09: 散点图 2
- Concept 10: 散点图 3
- Concept 11: 从散点图到预测
- Concept 12: 从散点图到预测 2
- Concept 13: 从散点图到决策面
- Concept 14: 良好的线性决策面
- Concept 15: 开始学习朴素贝叶斯
- Concept 16: 代码获取决策边界演示
- Concept 17: sklearn 使用入门
- Concept 18: GaussianNB使用示例
- Concept 19: 有关地形数据的GaussianNB 部署
- Concept 20: 计算 GaussianNB 准确性
- Concept 21: 训练数据和测试数据
- Concept 22: 贝叶斯规则 --- 深入解析朴素贝叶斯算法
- Concept 23: 贝叶斯规则
- Concept 24: 癌症测试
- Concept 25: 先验和后验
- Concept 26: 规范化 1
- Concept 27: 规范化 2
- Concept 28: 规范化 3
- Concept 29: 全概率
- Concept 30: 贝叶斯规则图
- Concept 31: 用于分类的贝叶斯规则
- Concept 32: Chris 或 Sara
- Concept 33: 后验概率
- Concept 34: 你独自得出的贝叶斯概率
- Concept 35: 为何朴素贝叶斯很朴素
- Concept 36: 朴素贝叶斯的优势和劣势
- Concept 37: 恭喜你学完了朴素贝叶斯
- Concept 38: 朴素贝叶斯迷你项目
- Concept 39: 迷你项目简介
- Concept 40: 针对作者身份的机器学习
- Concept 41: 设置代码
- Concept 42: 作者身份准确率
- Concept 43: 对 NB 分类器计时
-
Lesson 03: 支持向量机(SVM)
了解支持向量机(SVM)的原理,并使用 Scikit 学习编写一个 SVM。
- Concept 01: 欢迎学习 SVM
- Concept 02: 分隔线
- Concept 03: 选择分隔线
- Concept 04: 好的分隔线有何特点
- Concept 05: 间隔练习
- Concept 06: SVMs 和棘手的数据分布
- Concept 07: SVM 对异常值的响应
- Concept 08: SVM 异常值练习
- Concept 09: 移交给 Katie
- Concept 10: SKlearn 中的 SVM
- Concept 11: SVM 决策边界
- Concept 12: SVM 编码
- Concept 13: 非线性 SVM
- Concept 14: 非线性数据
- Concept 15: 新特征
- Concept 16: 可视化新特征
- Concept 17: 与新特征分隔
- Concept 18: 练习创建新特征
- Concept 19: 核技巧
- Concept 20: 尝试选择各种核
- Concept 21: 核和伽玛
- Concept 22: SVM C 参数
- Concept 23: 过拟合
- Concept 24: SVM 的优缺点
- Concept 25: SVM 迷你项目简介
- Concept 26: SVM 迷你项目
- Concept 27: SVM 作者 ID 准确率
- Concept 28: SVM 作者 ID 时间
- Concept 29: 更小的训练集
- Concept 30: 权衡速度与准确率
- Concept 31: 部署 RBF 内核
- Concept 32: 优化 C 参数
- Concept 33: 优化 C 后的准确率
- Concept 34: 优化后的 RBF 与线性 SVM:准确率
- Concept 35: 从 SVM 提取预测
- Concept 36: 预测有多少 Chris 的邮件?
- Concept 37: 部署 SVM 最后提醒
-
-
Module 02:
机器学习基础 2
-
Lesson 01: 决策树
学习决策树,包括墒和信息增益。
- Concept 01: 欢迎学习决策树
- Concept 02: 可线性分离的数据
- Concept 03: 多元线性问题
- Concept 04: 构建决策树/第一次分割
- Concept 05: 构建决策树/第二次分割
- Concept 06: 第二次分割后的类标签
- Concept 07: 构建决策树/第三次分割
- Concept 08: 决策树编码
- Concept 09: 决策树准确性
- Concept 10: 决策树参数
- Concept 11: 最小样本分割
- Concept 12: 决策树准确性
- Concept 13: 数据杂质与熵
- Concept 14: 在分割中尽可能减少杂质
- Concept 15: 熵公式
- Concept 16: 熵计算(第 1 部分)
- Concept 17: 熵计算(第 2 部分)
- Concept 18: 熵计算(第 3 部分)
- Concept 19: 熵计算(第 4 部分)
- Concept 20: 熵计算(第 5 部分)
- Concept 21: 信息增益
- Concept 22: 信息增益计算(第 1 部分)
- Concept 23: 信息增益计算(第 2 部分)
- Concept 24: 信息增益计算(第 3 部分)
- Concept 25: 信息增益计算(第 4 部分)
- Concept 26: 信息增益计算(第 5 部分)
- Concept 27: 信息增益计算(第 6 部分)
- Concept 28: 信息增益计算(第 7 部分)
- Concept 29: 信息增益计算(第 8 部分)
- Concept 30: 信息增益计算(第 9 部分)
- Concept 31: 信息增益计算(第 10 部分)
- Concept 32: 调整标准参数
- Concept 33: 偏差-方差困境
- Concept 34: DT 的优缺点
- Concept 35: 决策树迷你项目简介
- Concept 36: 决策树迷你项目
- Concept 37: 第一个邮件 DT:准确率
- Concept 38: 通过特征选择加速
- Concept 39: 更改特征数量
- Concept 40: SelectPercentile 和复杂度
- Concept 41: 1% 特征下的准确率
-
Lesson 03: 数据集与问题
开始了解安然数据集,提出有趣的问题。
- Concept 01: 简介
- Concept 02: 列出所有与安然丑闻相关的人 (POI)
- Concept 03: 准确率与训练集大小
- Concept 04: 下载安然数据
- Concept 05: 数据类型测验 1
- Concept 06: 数据类型测验 2
- Concept 07: 数据类型测验 3
- Concept 08: 数据类型测验 4
- Concept 09: 数据类型测验 5
- Concept 10: 数据类型测验 6
- Concept 11: 安然数据集迷你项目简介
- Concept 12: 数据集和问题迷你项目
- Concept 13: 安然数据集的大小
- Concept 14: 安然数据集中的特征
- Concept 15: 在安然数据中查找 POI
- Concept 16: 存在多少 POI?
- Concept 17: 不完整数据的问题
- Concept 18: 查询数据集 1
- Concept 19: 查询数据集 2
- Concept 20: 查询数据集 3
- Concept 21: 研究安然欺诈案
- Concept 22: 安然 CEO
- Concept 23: 安然主席
- Concept 24: 安然 CFO
- Concept 25: 跟着钱走
- Concept 26: 未填充的特征
- Concept 27: 处理未填充的特征
- Concept 28: 字典到数组的转换
- Concept 29: 缺少的 POI 1(可选)
- Concept 30: 缺少的 POI 2(可选)
- Concept 31: 缺少的 POI 3(可选)
- Concept 32: 缺少的 POI 4(可选)
- Concept 33: 缺少的 POI 5(可选)
- Concept 34: 缺少的 POI 6(可选)
- Concept 35: 混合数据源(可选)
-
-
Module 03:
机器学习基础 3
-
Lesson 01: 回归
使用线性回归为连续数据建模。
- Concept 01: 连续输出
- Concept 02: 连续
- Concept 03: 年龄:连续还是离散?
- Concept 04: 天气:连续还是离散?
- Concept 05: 电子邮件作者:连续还是离散?
- Concept 06: 电话号码:连续还是离散?
- Concept 07: 收入:连续还是离散?
- Concept 08: 连续特征
- Concept 09: 具有连续输出的监督学习
- Concept 10: 回归线性方程
- Concept 11: 斜率和截距
- Concept 12: 斜率
- Concept 13: 截距
- Concept 14: 使用回归的预测
- Concept 15: 添加截距
- Concept 16: 移交给 Katie
- Concept 17: 编码
- Concept 18: sklearn 中的年龄/净值回归
- Concept 19: 通过 sklearn 提取信息
- Concept 20: 通过 sklearn 提取分数数据
- Concept 21: 现在你练习提取信息
- Concept 22: 线性回归误差
- Concept 23: 误差
- Concept 24: 误差和拟合质量
- Concept 25: 最小化误差平方和
- Concept 26: 最小化误差平方和的算法
- Concept 27: 为何最小化 SSE
- Concept 28: 最小化绝对误差的问题
- Concept 29: 肉眼评估回归
- Concept 30: SSE 的问题
- Concept 31: 回归的 R 平方指标
- Concept 32: SKlearn 中的 R 平方
- Concept 33: 可视化回归
- Concept 34: 什么数据适用于线性回归
- Concept 35: 比较分类与回归
- Concept 36: 多元回归
- Concept 37: 多元回归 2
- Concept 38: 回归迷你项目简介
- Concept 39: 回归迷你项目
- Concept 40: 奖金目标和特征
- Concept 41: 可视化回归数据
- Concept 42: 提取斜率和截距
- Concept 43: 回归分数:训练数据
- Concept 44: 回归分数:测试数据
- Concept 45: 根据 LTI 回归奖金
- Concept 46: 工资与预测奖金的 LTI
- Concept 47: 异常值破坏回归
-
Lesson 02: 异常值
Sebastian 讨论如何选择和移除异常值。
- Concept 01: 回归中的异常值
- Concept 02: 产生异常值的原因
- Concept 03: 选择异常值
- Concept 04: 异常值检测/删除算法
- Concept 05: 使用残差的异常值检测
- Concept 06: 删除异常值对回归的影响
- Concept 07: 异常值删除策略的小结
- Concept 08: 异常值迷你项目简介
- Concept 09: 异常值迷你项目
- Concept 10: 带有异常值的回归斜率
- Concept 11: 带有异常值的回归分数
- Concept 12: 清理后的斜率
- Concept 13: 清理后的分数
- Concept 14: 安然异常值
- Concept 15: 识别最大的安然异常值
- Concept 16: 移除安然异常值?
- Concept 17: 还有更多异常值吗?
- Concept 18: 再识别两个异常值
- Concept 19: 移除这些异常值?
-
Lesson 03: 聚类
讨论非监督学习,了解如何使用 Scikit 学习的 K-均值算法。
- Concept 01: 非监督学习
- Concept 02: 聚类电影
- Concept 03: 多少个聚类?
- Concept 04: 将点与聚类匹配
- Concept 05: 优化中心(橡皮筋)
- Concept 06: 移动中心 2
- Concept 07: 匹配点(再次)
- Concept 08: 移交给 Katie
- Concept 09: K-均值聚类可视化
- Concept 10: K-均值聚类可视化 2
- Concept 11: K-均值聚类可视化 3
- Concept 12: Sklearn
- Concept 13: K-均值的挑战
- Concept 14: K-均值的局限
- Concept 15: 反直觉的聚类
- Concept 16: 反直觉的聚类 2
- Concept 17: 聚类迷你项目视频
- Concept 18: K-均值聚类迷你项目
- Concept 19: 聚类特征
- Concept 20: 部署聚类
- Concept 21: 使用 3 个特征聚类
- Concept 22: 股票期权范围
- Concept 23: 薪酬范围
- Concept 24: 聚类更改
-
-
Module 04:
机器学习基础 4
-
Lesson 01: 特征缩放
学习特征缩放,了解有哪些算法在使用前需要首先进行特征缩放。
- Concept 01: Chris 的 T 恤尺寸
- Concept 02: 针对 Chris 的度量
- Concept 03: Cameron 的身高 + 体重
- Concept 04: Sarah 的身高 + 体重
- Concept 05: 由我们的度量确定的 Chris T恤尺寸
- Concept 06: 利用不同的尺度来比较特征
- Concept 07: 特征缩放公式练习 1
- Concept 08: 特征缩放公式练习 2
- Concept 09: 特征缩放公式练习 3
- Concept 10: 最小值/最大值重缩放器编码练习
- Concept 11: sklearn 中的最小值/最大值缩放器
- Concept 12: 需要重缩放的算法练习
- Concept 13: 特征缩放迷你项目简介
- Concept 14: 特征缩放迷你项目
- Concept 15: 缩放类型
- Concept 16: 计算重缩放特征
- Concept 17: 何时部署特征缩放
-
Lesson 02: 文本学习
学习如何在你的机器学习算法中使用文本数据。
- Concept 01: 学习文本时的维度
- Concept 02: 词袋
- Concept 03: 美好的一天
- Concept 04: Day 先生热爱美好的一天
- Concept 05: 词袋属性
- Concept 06: Sklearn 中的词袋
- Concept 07: 低信息的单词
- Concept 08: 停止词
- Concept 09: 从 NLTK 中获取停止词
- Concept 10: 词干化以合并词汇
- Concept 11: 使用 NLTK 进行词干化
- Concept 12: 文本处理中的运算符顺序
- Concept 13: 由词频确定的权重
- Concept 14: 为何要向上加权少见单词
- Concept 15: 文本学习迷你项目简介
- Concept 16: 文本学习迷你项目
- Concept 17: parseOutText() 热身
- Concept 18: 部署词干化
- Concept 19: 清除“签名文字”
- Concept 20: 进行 TfIdf
- Concept 21: 访问 TfIdf 特征
-
Lesson 03: 特征选择
Katie 讨论在什么时候以及为什么使用特征选择,并教给你一些使用特征选择的技巧。
- Concept 01: 为何使用特征选择?
- Concept 02: 一个新的安然特征
- Concept 03: 一个新的安然特征练习
- Concept 04: 可视化新特征
- Concept 05: 警惕特征漏洞!
- Concept 06: 示例:有漏洞的特征
- Concept 07: 去除特征
- Concept 08: 特征不等于信息
- Concept 09: 单变量特征选择
- Concept 10: TfIdf 向量器中的特征选择
- Concept 11: 偏差、方差和特征数量
- Concept 12: 偏差、方差和特征数量 2
- Concept 13: 肉眼过拟合
- Concept 14: 带有特征数量的平衡误差
- Concept 15: 正则化
- Concept 16: 套索回归
- Concept 17: 套索回归练习
- Concept 18: 使用 Sklearn 进行套索预测练习
- Concept 19: Sklearn 中的套索系数练习
- Concept 20: 在 Sklearn 中使用套索练习
- Concept 21: 特征选择迷你项目简介
- Concept 22: 特征选择迷你项目
- Concept 23: 过拟合决策树 1
- Concept 24: 过拟合决策树 2
- Concept 25: 特征数量和过拟合
- Concept 26: 过拟合决策树的准确率
- Concept 27: 识别最强大特征
- Concept 28: 使用 TfIdf 获得最重要的单词
- Concept 29: 删除、重复
- Concept 30: 再次检查重要特征
- Concept 31: 过拟合树的准确率
-
Lesson 04: 主成分分析(PCA)
学习数据为度,使用主成分分析(PCA)减少维度数量。
- Concept 01: 数据维度
- Concept 02: 较棘手的数据维度
- Concept 03: 一维或二维?
- Concept 04: 略微不完美的数据
- Concept 05: 最棘手的数据维度
- Concept 06: 用于数据转换的 PCA
- Concept 07: 新坐标系的中心
- Concept 08: 新坐标系的主轴
- Concept 09: 新系统的第二主成分
- Concept 10: 练习:查找中心
- Concept 11: 练习:查找新轴
- Concept 12: 哪些数据可用于 PCA
- Concept 13: 轴何时占主导地位
- Concept 14: 可测量的特征与潜在的特征练习
- Concept 15: 从四个特征到两个
- Concept 16: 在保留信息的同时压缩
- Concept 17: 复合特征
- Concept 18: 最大方差
- Concept 19: 最大方差的优点
- Concept 20: 最大方差与信息损失
- Concept 21: 信息损失和主成分
- Concept 22: 相邻复合特征
- Concept 23: 用于特征转换的 PCA
- Concept 24: 最大主成分数量
- Concept 25: PCA 的回顾/定义
- Concept 26: 将 PCA 应用到实际数据
- Concept 27: 安然财务数据的 PCA
- Concept 28: sklearn 中的 PCA
- Concept 29: 何时使用 PCA
- Concept 30: 用于人脸识别的 PCA
- Concept 31: 特征脸方法代码
- Concept 32: PCA 迷你项目简介
- Concept 33: PCA 迷你项目
- Concept 34: 每个主成分的可释方差
- Concept 35: 要使用多少个主成分?
- Concept 36: F1 分数与使用的主成分数
- Concept 37: 维度降低与过拟合
- Concept 38: 选择主成分
-
-
Module 05:
机器学习基础 5
-
Lesson 01: 交叉验证
在这节课中继续了解测试、训练、交叉验证和参数网格搜索。
- Concept 01: 既有趣、又有益的交叉验证
- Concept 02: 测试的好处
- Concept 03: 在 Sklearn 中训练/测试分离
- Concept 04: 何处使用训练与测试数据 1
- Concept 05: 何处使用训练与测试数据 2
- Concept 06: 何处使用训练与测试数据 3
- Concept 07: 何处使用训练与测试数据 4
- Concept 08: K 折交叉验证
- Concept 09: Sklearn 中的 K 折 CV
- Concept 10: 针对 Sklearn 中的 K 折的实用建议
- Concept 11: 为调整参数而进行的交叉验证
- Concept 12: Sklearn 中的 GridSearchCV
- Concept 13: Sklearn 中的 GridSearchCV
- Concept 14: 开始验证迷你项目
- Concept 15: 验证迷你项目简介
- Concept 16: 验证迷你项目
- Concept 17: 第一个(过拟合)POI 识别符
- Concept 18: 部署训练/测试机制
-
Lesson 02: 整体回顾
花点时间和 Sebastian、Katie 一起回顾一下我们在这节课中都学到了什么!
-
Part 12 (Elective) : (可选)关系型数据库入门
-
Module 01:
关系数据库入门
-
Lesson 01: 数据和表格
你将学习关系型数据库如何让你将数据整理为表格的结构。你将学习唯一键和连接不同表格的重要性。
- Concept 01: 关系型数据库简介
- Concept 02: 什么是数据库
- Concept 03: 了解表格
- Concept 04: 数据类型和意义
- Concept 05: 数据意义
- Concept 06: 动物园
- Concept 07: 表格的结构
- Concept 08: 回答表格的问题
- Concept 09: 聚合
- Concept 10: 查询和结果
- Concept 11: 如何查询
- Concept 12: 最喜欢的动物
- Concept 13: 相关表格
- Concept 14: 唯一性和键
- Concept 15: 主键
- Concept 16: 合并表格
- Concept 17: 数据库概念
- Concept 18: 总结
-
Lesson 02: SQL 的元素
你将开始学习大多数关系数据库用到的结构化查询语言(SQL)。
- Concept 01: SQL 与大象
- Concept 02: 与动物园数据库通信
- Concept 03: SQL 中的数据类型
- Concept 04: 几种 SQL 类型
- Concept 05: Select Where
- Concept 06: 比较运算符
- Concept 07: SQL 的一个缺点
- Concept 08: 实验页面
- Concept 09: Select 子句
- Concept 10: 数据库的优势
- Concept 11: 计算所有物种
- Concept 12: 插入:添加行
- Concept 13: 寻找吃鱼的动物
- Concept 14: 汇总后
- Concept 15: 更多连接练习
- Concept 16: 总结
- Concept 17: 安装虚拟机
-
Lesson 03: Python DB-API
用 Python 连接一个后端数据库,查找和修复后端工程师经常会遇到的 bug。
- Concept 01: 欢迎学习数据库
- Concept 02: 什么是 DB-API
- Concept 03: 使用 DB-API 编写代码
- Concept 04: 试用 DB-API
- Concept 05: DB-API 中的插入操作
- Concept 06: 运行 forum
- Concept 07: Hello PostgreSQL
- Concept 08: 为应用添加后端数据库
- Concept 09: 帖子破坏者 Bobby Tables
- Concept 10: 修复 Bobby Tables
- Concept 11: 垃圾表格
- Concept 12: 阻止垃圾内容出现
- Concept 13: 通过更新删除垃圾内容
- Concept 14: 删除垃圾内容
- Concept 15: 结论
-
Lesson 04: 深入学习 SQL
探索 SQL 高级功能,例如创建你自己的表格和合并。
-